分析一下占豪这个号
此为公众号数据分析第二篇,第一篇参见
这次要分析的号比上次的还牛。
首先,大家不妨先来猜几个数据:
10W+的文章常见,但一个号的10W+的篇数可以多达多少篇?
10W+的文章不稀奇,10W+的点赞你见过多少?
你见过一篇文章赞赏数最多的有多少个?
下面,一起来看看:
公众号名:占豪
分析理由:尝试分析大V号;完成冯大作业;我对这个号不熟,可做纯客观分析。
分析文章时间范围:
第一篇(2013-12-21)至2018-11-21
这个时间跨度共1796天,实际发文1722天。
文章:共 6453 篇,其中图文类型6430篇,纯文字类型23篇。
文章因违规/被举报/自己删除等一共删除了138篇,目前可正常查看的图文6292篇,分布于1695天中。
以下是整体概览
下面所有的分析都是先文后图
看看原创情况
原创占比 59% ,比例不高,但平均下来一天有2篇多原创,不容易了。
看其阅读数和点赞数随时间推移的变化情况,请注意点赞数和阅读数是相同的纵坐标,大V的点赞数竟然都不需要另用次坐标的。
从其第一次发文到第一个10W+大概用了7个月。
占豪可以一天发多次图文,但极少用到,绝大多数时候一天只发一次,其一次发文的文章条数的分布情况如下。
提醒一下:其最开始的一段时间一天只发一条文章(不知道是当时微信的限制还是占豪故意没多发)全划到“1篇”里面。这会对后面的某些统计结果产生影响。
下图是分别统计头条、次条...8条的情况,请注意所有的阅读数、点赞数都是将10W+当作10W来算的,即下表的阅读数和点赞数都是低估了的。
公众号文章的第一重要指标大概就是阅读量,有多少小编希望有一篇文章的阅读量能达到10W+啊,甚至像曹大这样的大牛也不过只有3篇10W+。
但是,在占豪这里,阅读量不到10W+反而成了少数,因为其6292篇有效图文中,有5022篇的阅读量是10W+, 也就是说10W+的比例高达80%,看到这个数据时我都颤抖了。
80%的10W+也说明了其并不是只有头条图文能拿到10W+,事实上是1-8条都有10W+
即使是算平均值,10W+统统按10W算,平均阅读量也达到了92913/篇。想想我的公众号阅读量连人家的零头的零头都不到。
上面说了,10W+并不能代表这些文章的真实阅读量,但可以通过赞阅比去大致估算一下:
这些10W+文章的平均点赞数是 9739/篇。
那些不满10W+的文章的平均赞阅比是1.4%,可作为所有文章的真实赞阅比。
那么粗略估计一下这些10W+文章的平均阅读数大概是 9739 / 1.4% = 695612 / 篇,这下好了,我的公众号阅读量连人家的零头的零头的零头都达不到。
在占豪这里,之前分析曹大文章的许多方法要大改了,比如在阅读数多数爆表的情况下都用不着过多的分析了,直接分析点赞数和打赏数吧。
比如下图的点赞数统计表,平均点赞数都达到了7963,堪比一般号的阅读数了。
而且,人家竟然有10篇点赞数10W+的。
下表就是那10篇大作,时间相当集中,通过标题大概可以回想到当时的情况。人家的一条《让大家惦记了!!!》都能有10W+的点赞量,可见粉丝们对他是深深的爱呀。别急,本文中所有提到的值得关注的文章都可以通过点击“阅读原文”看到其原始链接。
统计下其阅读数不足10W+的1200多篇文章的赞阅比分布,前面说了平均赞阅比只有1.4%,其实不止占豪和曹大这种大号,几乎所有公众号的赞阅比都挺低的。不过其有一篇文章的阅读数10000多,赞阅比竟达到了惊人的80%。
下面是赞赏情况,其创号初期没有赞赏,2018年的前几个月应该是主动关闭了赞赏。
赞赏数最多的一篇达到了 9166个,如果一人赞赏1元钱,就差不多顶一个白领一个月的工资了,而如果一个赞赏10元钱,差不多顶许多人一年的收入了。对了,这个号的总赞赏量是566143笔,这还没算软文广告、文中广告等收入。不用眼红人家,因为我这么算账其实是很肤浅的。
另外别忘了只有原创文章才可以开通赞赏。而其原创文章3814篇,非原创文章2639篇。在此处之前给出的“平均赞赏”都是没有区分是否原创文章的。如果把这566143个赞赏平均到原创文章身上,则平均每篇的赞赏有148个。我的公众号创立至今好像总赞赏数都不到100个。
下面是赞赏数前10的文章,详细链接也放在了“阅读原文”中。
来看一下占豪的写作风格,下图是不同时间段发文章数量的统计表,其中00表示统计时间段为00:00-00:59。其最大的特点是喜欢大半夜发文,上午7点至11点从来没发过文章,占豪工作室的人可能上的都是夜班。
其字数达到了 2901字/篇(本文总字数约2600左右),基本做到了每篇都是文字充实。
如果只看头条文章的话:
在1662篇头条中有1413篇10W+,占85%
所有10篇点赞数10W+的文章全部为头条
当然大号也偶尔有文章不给力的时候,下面是在其首篇10W+的文章日期之后筛选出的阅读数最少的前20的文章,橙色背景的就是那篇赞阅比达80%但阅读量少得可怜的“奇文”,真怀疑是不是微信的统计系统在当时出问题了。
老规矩,统计一下这6000多篇文章的标题和正文中出现最多的词汇。可以看得出都是些国际政经热门词汇,这与占豪的定位高度重合。另外标题的统计并没有省略“为何”、“什么”这些词汇,因这也是起标题的智慧,但正文统计中省略了这样的语气词汇。
下图是标题的词云
下图是正文的词云
总结:
占豪,这是个超级大号,数据耀眼,我等小辈只能仰望喽。但是希望大家看完本文后不只有张大的嘴巴,还能有能为自己所用的一点点收获。
后记:
我曾以为分析曹大的首篇是从0到1的最难过程,分析占豪的只不过是从1到100的数据量增加而已,程序应该是一样的。但是实际分析的过程中发现要比分析曹大的难度大多了:文章多了、特例多了、数据维度多了之后可供挖掘的方向多了许多,其中的取舍并没有做好,有许多想列出但又怕太啰嗦的数据已经被我砍掉了。我深知本文还有许多欠考虑的地方,欢迎指正。
另外文中提及的所有类型的数据我都可批量获取,我还做了个公众号文章批量导出软件,若您恰好有需求欢迎勾搭。当然除了做个初级搬运工,如何从数据中挖掘出更多价值是件有意义也有挑战的事情,欢迎讨论。
欢迎关注本公众号,后续还会有其他分析报告
也欢迎加我个人微信号 kakalongcn
最后,别忘了文中提到的那些大作都放在了左下角“阅读原文”中。